Národní úložiště šedé literatury Nalezeno 95 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Speech Technology Application in Pronunciation Training and Foreign Language Learning
Barotová, Štěpánka ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
This diploma thesis deals with automatic English pronunciation assessment and error detection based on the Dynamic Time Warping (DTW) algorithm. It focuses on the improvement of an existing pronunciation training application and it proposes three areas of improvement: user interface, algorithm and corrective feedback. After various methods used for pronunciation assessment are discussed in the first part, the new design is introduced, the proposed system is described and three sets of experiments are performed. The experiments focus on phoneme-level error detection, syllable-level primary stress error detection and word-level intonation assessment and they are designed to be able to provide corrective feedback to the user. The last part of the thesis describes how all three areas of improvement were tested.
Přidávání nových slov v dynamickém dekodéru pro rozpoznávání řeči
Škrdlík, Kryštof ; Veselý, Karel (oponent) ; Schwarz, Petr (vedoucí práce)
Výstupem této práce je modifikovaný rozpoznávač řeči firmy Phonexia, do kterého je možné za běhu přidávat nová slova, která nejsou obsažena v jeho slovníku. Zvolená implementovaná metoda funguje na principu vkládání konečných automatů s novými slovy přímo do modifikované statické rozpoznávací sítě popisující kombinovaný jazykový a výslovnostní model rozpoznávače na předem připravená místa. Tato metoda poskytuje srovnatelné výsledky s výchozím rozpoznávačem.
Integrace hlasových technologií na mobilní platformy
Černičko, Sergij ; Černocký, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Popsat současný stav výzkumu a vývoje řečových technologií. Navrhnout a implementovat serverový rozpoznávač řeči, který využívá BSAPI. Integrovat klienta, který bude využívat server pro rozpoznání řeči, do mobilních slovníků společnosti Lingea.
Rozpoznávač řeči s omezeným slovníkem
Vystavěl, Kamil ; Míča, Ivan (oponent) ; Sysel, Petr (vedoucí práce)
Bakalářská práce se zabývá implementací metody rozpoznávání řeči s omezeným počtem rozpoznávaných slov v prostředí Matlab. Rozpoznávač je založen na metodě dynamického programování realizované algoritmem borcení časové osy (DTW) a je určen pro rozpoznávání izolovaných slov. Z řečového signálu jsou vyčíslovány příznaky pomocí metod krátkodobé analýzy signálu v časové a kmitočtové oblasti, dále pomocí metod na principu kepstrální analýzy a lineární prediktivní analýzy signálu. Příznaky vytvoří obraz slova vhodný pro kvantifikaci míry podobnosti s obrazem jiného slova. Algoritmus borcení časové osy eliminuje vliv kolísání tempa promluvy nelineární normalizací časové osy jednoho ze slov tak, aby se obrazy slov co nejvíce shodovaly. Míra podobnosti dvou slov je vyčíslena jako vzdálenost slov. Ve slovníku rozpoznávače jsou uloženy obrazy známých slov, obraz neznámého slova je porovnán s obrazy slov ve slovníku a jsou vyčísleny vzdálenosti každého známého slova s neznámým slovem. Neznámé slovo je určeno jako shodné s tím slovem ve slovníku, ke kterému má nejmenší vzdálenost. Úspěšnost klasifikace je závislá především na volbě příznaků.
Nahrávaní telefonátu a vyhledávání pro Skype
Nytra, Jiří ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Práce se zabývá vytvořením programu komunikujícím s aplikací Skype, který umožňuje nahrávat hovory, v nichž dokáže vyhledávat klíčová slova pomocí moderních technologií rozpoznávání řeči. V práci je představeno rozhraní a protokol pro komunikaci s programem Skype, nahrávání hovoru a metoda LVCSR pro vyhledávání klíčových slov.
Síťový interface k detektoru klíčových slov
Skotnica, Martin ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
Rozpoznávání řeči je oblastí, která je v současné době celosvětově intenzivně studována. Systémy schopné rozpoznat mluvenou řeč se stávají součástí běžného života v mnoha aplikacích. Jednou z nich je i detekce klíčových slov, způsob jak odhalit výskyt určitých slov v datech. Detektor vyvinutý na VUT Fakultě informatiky nám umožňuje detekovat tyto slova. Cílem této práce je tedy navrhnout a implementovat síťový interface k detektoru klíčových slov na bázi klient/server. Cílová aplikace se připojí na server a posílá mu zvuková data. Server na tyto data spouští detektor klíčových slov a výsledek posílá zpět klientovi, kde se interaktivně zobrazí uživateli.
Zobrazování uživatelských výslovností pro elektronické slovníky
Pešán, Jan ; Chalupníček, Kamil (oponent) ; Černocký, Jan (vedoucí práce)
Tato bakalářská práce se pokouší nalézt nový směr vývoje v oblasti učebních schopností elektronických slovníků. V první části je uvedeno představení základní myšlenky možnosti učení výslovnosti pomocí vizualizace fonémů. Následuje kapitola zabývající se obecným úvodem do metod zpracování řeči využívaných v této práci jako např. HMM nebo Viter­biho algoritmus. Ve třetí kapitole jsou popsány nástroje, pomocí kterých byla provedena implementace celého systému. Další kapitola rozebírá podrobně použitou technologii neu­ronových sítí jako systému odhadu věrohodností fonémů, popisuje problém kompatibility fonémových sad a použité modely fonémů. Kapitola 5 popisuje konkrétně samotnou im­plementaci systému. Zde jsou také popsány nástroje použité k přípravě dat pro systém. Ve dvou závěrečných kapitolách je poté obsaženo krátké uživatelské testování společně se screenshoty a zhodnocením celého projektu. Zde jsou také nastíněny další možné cesty vývoje tohoto systému.
Penetration Tests of Speaker Verification System
Wojnar, Filip ; Landini, Federico Nicolás (oponent) ; Plchot, Oldřich (vedoucí práce)
The aim of the thesis is to realize penetration tests of automatic speaker verification system with use of text-to-speech model. The thesis is focused on inner functioning of those systems and spoofing attacks against them. The thesis is also focused on speech synthesis. Later chapters are focused on realization of realized penetration tests and discussion about results they brought us.
Paralelní trénování neuronových sítí pro rozpoznávání řeči
Veselý, Karel ; Fousek, Petr (oponent) ; Burget, Lukáš (vedoucí práce)
Tato diplomová práce je zaměřena na paralelizaci trénování neuronových sítí pro rozpoznávání řeči. V rámci této diplomové práce byly implementovány a porovnány dvě strategie paralelizace. První strategií je paralelizace dat s využitím rozdělení trénování do několika POSIX vláken. Druhou strategií je paralelizace uzlů s využitím platformy pro obecné výpočty na grafických kartách CUDA. V případě první strategie bylo dosaženo 4x urychlení, v případě využití platformy CUDA bylo dosaženo téměř 10x urychlení. Pro trénování byl použit algoritmus Stochastic Gradient Descent se zpětným šířením chyb. Po krátkém úvodu následuje druhá kapitola práce, která je motivační a zasazuje probém do kontextu rozpoznávání řeči. Třetí kapitola práce je teoretická a diskutuje neuronové sítě a metodu trénování. Následující kapitoly jsou zaměřené na návrh a implementaci a popisují iterativní vývoj tohoto projektu. Poslední obsáhlá kapitola popisuje testovací systém a uvádí výsledky provedených experimentů. V závěru jsou krátce zhodnoceny dosažené výsledky a nastíněna perspektiva dalšího vývoje projektu.
Adaptace rozpoznávače řeči na datech bez přepisu
Švec, Ján ; Karafiát, Martin (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.

Národní úložiště šedé literatury : Nalezeno 95 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.